Introdução

Testes multivariados versus univariados

👉 Os testes de hipóteses em um contexto multivariado são muito mais complexos do que num contexto univariado.

Considerando a distribuição normal, temos

  • no caso univariado, uma média (\(\mu\)) e uma variância (\(\sigma^2\)), totalizando dois parâmetros,

  • no caso \(p\)-variado, \(p\) médias, \(p\) variâncias e \(\left( \begin{array}{c} p \\ 2 \end{array} \right)\) covariâncias, totalizando

\[p + p +\left( \begin{array}{c} p \\ 2 \end{array} \right) = \dfrac{1}{2} p(p+3)\]

parâmetros.

Testes multivariados versus univariados

Por exemplo, para \(p = 10\), temos

\[\dfrac{1}{2} p(p+3) = \dfrac{10(10+3)}{2} = \dfrac{130}{2} = 65\]

parâmetros, para cada um dos quais uma hipótese poderia ser formulada.

Além disso, podemos estar interessados em testar hipóteses sobre subconjuntos desses parâmetros, ou ainda, sobre funções deles.

Testes multivariados versus univariados

🤔 Por que utilizar testes multivariados ao invés de testes univariados?

  1. Usar \(p\) testes univariados inflaciona o erro tipo I, \(\alpha\), enquanto o teste multivariado preserva o valor exato de \(\alpha\).
  • Por exemplo, se fizermos \(p = 10\) testes univariados ao nível \(\alpha = 0,05\), a probabilidade de pelo menos uma falsa rejeição é maior que 0,05.
    • Se as variáveis forem independentes, teríamos, sob \(H_0\):

\[\begin{eqnarray*} P(\text{pelo menos uma rejeição}) &=& 1 - P(\text{todos os 10 testes não rejeitarem } H_0) \\ &=& 1 - (0,95)^{10} = 0,40 \end{eqnarray*}\]

👉 Se as variáveis não forem independentes, teríamos \(0,05 < \alpha < 0,40\)

Testes multivariados versus univariados

🤔 Por que utilizar testes multivariados ao invés de testes univariados?

  1. Os testes univariados ignoram completamente as correlações entre as variáveis.
  1. Os testes multivariados são mais poderosos em muitos casos.
  • Poder de um teste: probabilidade de rejeitar \(H_0\), quando esta é realmente falsa.
  1. Muitos testes multivariados envolvendo médias têm como subproduto a construção de uma combinação linear das variáveis que revela mais sobre como as variáveis se unem para rejeitar a hipótese.

Teste para \(\mathbf{\mu}\) com \(\mathbf{\Sigma}\) conhecido

Num primeiro momento, vamos revisar o caso univariado de se testar a média, \(\mu\), de uma população com \(\sigma^2\) conhecido.